查看原文
其他

高盛教我“长期贪婪”,所以我要做人工智能——奥赛金牌闫安的AI路线图

2017-03-20 春晓 交易门


闫安比约定的时间早到了几分钟。见到我时,他笑着站起来跟我握手。他的冰咖啡已经喝了一大半。

2017年3月一个工作日上午10点,香港IFC里这家咖啡店已然满座。我们旁边坐着肤色各异,讲不带口音英语的型男型女。他们穿着贴身西装小背心,头发用塑形胶整得棱角分明。

坐在我面前的闫安穿着休闲衬衫,放松自然,头发也无立体造型。他气质朴实,却跟周围人群有种“和而不同”之感。

闫安在北京出生、长大。他是1996年国际数学奥林匹克竞赛(IMO)金牌得主。闫安1997年保送北京大学数学系,2000年本科毕业,进入美国斯坦福大学,先后学习数学和金融。在斯坦福大学攻读金融博士学位期间,闫安离校,前往高盛东京的Sales and Trading Desk工作。

“我对自己学的东西,特别是金融理论没信心,想去行业内看看到底在发生什么。”他这样解释当初的动机。

闫安在高盛东京工作了一年。他很快发现自己对金融业兴趣不大,但高盛倡导的“Long Term Greedy(长期贪婪)”理念引发他深思。

“我觉得(这说法)很有道理,但Greedy(贪婪)最终的目的是什么?我在高盛没有找到。我觉得他们的目的是把自己变成一堆钱。但是把人变成一堆钱之后呢,要做什么?” 

辗转几家国际金融机构,从美国到东京到香港,闫安找到了答案——人工智能。

闫安认为,人工智能是未来社会的基础设施,对于世界的重要性,将不亚于水、电、气。就像每一个城市都有自己的医院一样,未来每一个城市都应该有自己的DeepMind(英国的一家人工智能公司,2014年被谷歌收购)。

闫安想,如果自己能在人工智能的任何一个方向取得突破,比如数学定理证明、深度强化学习,都会创造无法估量的价值:“这是让我非常兴奋的目标,就是我们可以集体走进一个更高级的社会。”

就像一个彷徨许久的人终于在茫茫人海中发现真爱,闫安就这么找到了人工智能。

至于怎么推进人工智能的研究,闫安一开始并没有清晰的线路。他一门心思要去做研究、读论文。这个行业论文阅读量巨大。行业三大会议之一,ICLR(International Conference of Learning Representation)一次发500篇论文。闫安一个人可能要花两个月时间读完。刚读完,下一波论文又出来了。

2016年12月的一天,闫安灵光一动,萌发了开公司的念头。“我一想,这件事这么好,我要去促进这件事啊。”

当月,公司在香港正式注册,闫安成为唯一的股东和董事。他一边做研究,一边开公司账户,一边琢磨公司融资、运作模式。

2017年2月,闫安在北大香港校友会的春节聚餐上分享了自己对于人工智能的思考。3月,闫安又前往香港英皇佐治五世学校跟中学生们做了一次讲座。

普及AI领域的进展,在闫安看来,是自己“力所能及的主要公共服务”。

闫安3月在香港英皇佐治五世学校为中学生们做人工智能的讲座。这是讲座PPT截图。


在另一条战线上,闫安积极地跟香港高校联系科研合作。如果顺利,今年夏天,韩国首尔国立大学和香港科技大学的两组学生将加入闫安的AI研究小组。这将部分缓解他的科研压力。

“闫安虽然看上去很理想主义,其实落地能力很强。”闫安的朋友王远航告诉我。

这几个月,闫安像他研究的学习系统一样,一边跟环境交互,一边学习、提高。

他关于公司的想法在演变。今年3月初,我第一次跟闫安聊到商业模式时,他说自己并不是从原则上反对商业化。一个多星期后,我们再见面,他决定不再考虑商业模式,以非营利的方式来运作公司——“类似美国的 OpenAI”。

目前闫安主要精力集中在三条主线:一是人工智能安全性的研究;二是连续更新的Literature Review(由于文献综述工作量大,他觉得最好是有个科学家团队组织起来,一人看一块);三是自动数学定理的证明。

“说不定六七年之后,计算机就会解决数学中未解决的问题——例如哥德巴赫猜想(哥德巴赫猜想用现代数学语言可以陈述为:任一大于2的偶数,都可表示成两个素数之和) 。可能出来的证明是几百页谁也看不懂的逻辑符号。”他说。

闫安在微信上拉了一个“AI资讯群”。几十个人中,就有多位数理化信息学国际奥赛金牌得主。群里的小伙伴们纷纷称闫安为“教主”。

一次,微信群讨论招人的问题,有朋友问闫安:“在中国能发顶会(顶级会议)的人行情价就要六十万起,你真的准备招吗?”

“招,一百万起。”闫安说,“100个这样的人就能组半个DeepMind了,年费一个亿,这是多好的deal?加上各种overhead(运营费用),年费两亿。”

这时,群里一位奥赛金牌朋友立即泼冷水:“建议教主多接触一下现实生活。”

也许在外人看来,闫安对人工智能的执着似乎有点“堂吉诃德”的味道。然而他对怎样前进,其实心中已经有了清晰的路线图。

闫安告诉我,人工智能一旦成为社会的基础设施,我们会生活在一个非常不一样的世界。那个时候再来看现在的我们,会像我们现在去看工业革命之前的世界。

他说:“跟这件事比起来,其它事就不那么重要了。”

闫安在香港海洋公园



对话


Q:你最早关注人工智能是什么时候?

A:2013年,我发现出现了很多人工智能的新闻,图像识别领域出现了突破。2013年底,伦敦的一家公司DeepMind用计算机玩视频游戏取得了一些进展,2014年初它被谷歌收购。看到这些新闻后,我觉得这个领域很有意思,就去学一些相关的知识,像计算机,神经科学。一边学,一边看新的论文。


Q:作为一名研究者,你发现这个领域和其它学科最大的不同是什么?

A:首先,这个领域的论文都比较公开。不像商学院、数学系,那些论文要发表之后很久,Review (被评审)之后过了一年才出来。这个领域的进展速度是我以前从没有见过的。以前不管数学,还是金融,都是你要学很久才能到这个领域的前沿。然后你发现,到了前沿,大多数commensensically(常识上)可以做的东西都被做的差不多了。只有一些很小的地方往前走一点,而要花很多时间才能真正理解别人在做什么。

而这个领域很不一样,就好像哥伦布发现新大陆一样,你发现有好多可以做的东西。原因是这个领域之前经历了一个长时间的寒冬。人们起先认为用神经网络的方式去做人工智能是行不通的。因为之前一直缺少证据。全世界只有一小撮人在做。因为人不够,所以这个领域发展受到了很大的阻碍,比别的领域缓慢很多。但这一次重新来过之后,你就发现你要用几年的时间,把过去20年时间落下的进程补回来。只要你有一定基础,你就可以马上去接触到前沿的东西。

今年4月24号即将召开一个行业顶级会议,ICLR(International Conference of Learning Representation), 去年11月份截止收论文。官网显示来自全世界的作者交了490篇论文,其中选出可以口头去讲的是15篇,占到约3%。这15篇里面,大部分都是谷歌、Facebook这种很大的实验室出的。但还有一篇Single Author (单一作者)的文章,是个大三的学生写的。

这是个很开放的领域。你不需要是一个积累了十几年二十几年的专家,在一个方向上突破一两年,有一定积累,你就可以走到世界前沿。我可以作为一个不是内行的人,很快了解到前沿,很快看到前景是什么。


Q:你怎样理解人工智能的前景?

A:首先,前景并不是我去做一个应用程序让大家去download(下载),或者我去做一个网站,提供一个服务。

我们沿这个方向走下去,可以把人类智能做到机器里面去,就可以很快规模化、放量。本质上讲我们面对的是一个潜在的、未来智能化的系统。像一个新的基础设施一样,把整个社会推到新的高度上。就好像我们现在这个社会很繁荣,很大程度上依赖于水电气很方便供应给大家,有一个城市,大家可以在里面很开心地生活。

你想,未来的基础设施是什么?就是可以把人的智能实现出来。比如你想看电影,可能这个计算机跑几个小时,一个新的电影出来了。不需要导演,演员去拍。你说你需要软件,软件也可以计算机自己来生成,你告诉它你需要什么,然后它生成这些程序。这是个运算的过程。再比如说像Google这个网站,它有20亿行代码,2万5000名工程师(根据2015年9月的Wired数据),每天有很多个更新,代码不断扩张。这个事情对人的价值很大的,本质上也是个计算的过程。在生活中把知识、常识转换成代码放进去。这件事本质上也可以数字化。

当我们有一个很好的基础设施,可以自动地去生成这些东西的时候,那么我们生活的社会是一个非常不一样的社会。那个时候看我们,就好像我们看工业革命之前一样。

所以看到这个前景之后,其它事情,跟这个比较起来,都不是那么重要了。


Q:你的切入点在哪里?

A:我最早的想法是,我就好好学,争取自己写一些论文,走在前面。慢慢我发现,这件事是不切实际的。比如ICLR一次发500篇论文,一个人想去把它读下来?你都没有时间把它读完。等你花两个月时间把它读完,下一波论文又出来了。

这个领域像ICLR这样的会议有三个。另外两个,一个叫ICML(International Conference of Machine Learning),一个叫NIPS (Neural Information Processing System)。其中NIPS是最重要的,其次是ICML,其次才是ICLR。然后呢,每一个会议都会有一个deadline(截止日期),分别是11月,2月和5月。每到这个deadline,就会有大批论文出来。

所以这个领域,是每年前进三步。像刚刚结束的这个ICML的deadline,我有很多论文要看。光是DeepMind,这个月就发了至少7篇论文。进展非常快的话,你要往前线做研究。虽然前线很近,你如果知道哪个方向,可能一两年就可以到那个方向——但你怎么知道哪个方向,因为你有这么多的方向在同时前进。


Q:所以你感觉需要一个团队?

A:所以比较好的方法,是有个科学家团队组织起来,每个人看一块,通过互相的交流,对整个发展有一个全貌,再去实现这些论文上的具体的做法。因为很多论文不包括源代码。写好之后,有一个Expertise(专业权威),既知道之前发生什么,又有自己的工程能力,这时候可以再往前突破,可以很有效率,走的方向也是对这个领域的前进产生效果。

像DeepMind,Google Brain这样有一个团队,是有很大的优势的。所以如果我们要为这个领域做一些贡献的话,至少也要有一个相当规模的团队。


Q:你具体的线路图是怎么样的?

A:我现在具体做的事有这么几条线:

因为一个人没有很多时间写代码,我先做一些人工智能安全性的研究。社会上很多人很重视:把人的智能做到计算机里面,会不会出现终结者、天网这样的事?我想说,东西出来之后,相当于是一个很有智慧的基础设施。比如说我们生活的环境,地球,作为一个系统,它是很有智慧的。我们在这个地球上诞生。但我们不会觉得它是个危险的环境。一个好的人工智能,它是一个推着我们前进的相当自然的东西。不能把它想成一个有了超级能力的人,他会跟我们去抢资源,或者奴役我们。不是这样。

如果自己能写一些东西出来,能把人工智能的公关问题解决,让大家觉得这是一个很好的东西。

还有一条线:我想写一个连续更新的literature review(文献综述)。现在文献更新速度太快。你一个人做不到能够走到前线。我也在尽量找有兴趣的人一起做。大家一起做review。有人去看memory,有人去看continual learning,有人看应用、图像、影音,大家能拼成一个完整的图。

具体的项目,我也在考虑去做自动数学定理的证明。这块一个好处呢,就是,你看AlphaGo。如果你看围棋的领域进展,你看计算机围棋的水平,从一段,二段,三段,突然就10段。是一个爆发的过程。它是怎么爆发的。本来下围棋的系统是很成形的。就是你看到一个棋盘,猜下一步怎么走,把所有线路模拟出来,看哪一个最好,怎么下。这个事情不practical(实际),因为围棋变化太多,你真的用计算机穷举的话,计算能力不够。所以AlphaGo做了件什么事呢,它把这个穷举这个过程,用神经网络来代替。

我不是去穷举所有的做法,我是用神经网络去猜。200种做法,我只看20种做法,就知道怎么走。他们是把人工智能新的做法,放到一个已经成形的系统中去。我觉得类似的事情很可能在未来几年内也发生在自动定理证明这个领域。

因为数学证明也是我们知道要证明什么,也知道有哪些假设,然后像下棋那些用树形搜索的方式。穷举下一步要证的,本身也是没有效率的。如果把人工智能的方法做进去,感觉会有新的提高。说不定六七年之后,计算机就会解决数学中未解决的问题(例如哥德巴赫猜想)。可能出来的证明是几百页谁也看不懂的逻辑符号。这样的话既是一个很好的实用项目,又是一个很好的理论项目。

实用上就是你在一个很好的方向上为社会做出了贡献。你也可以推动更多数学家转型做别的。他们都很聪明,可以去推动别的方向发展。理论上,你也可以进一步提升人工智能本身的能力。因为数学证明还是比围棋难得多的一个领域。


Q:AI的哪个方向最让你兴奋?

A:AI这个领域很大。对外行来讲,细分一下,就是Deep Learning(深度学习)。再细分一点,叫Deep Reinforcement Learning(深度强化学习)。它跟Unsupervised Learning有很大的交叉。再往下面细分,就是构造一个好的学习的架构。这个架构的设计,会用到很多来自神经科学、或者认知科学等其他领域的启发。把人的智能构造,放到学习架构里去,把这个学习架构放到相对复杂的系统,去提高学习架构的智能。

这个系统可以像围棋,也可以像游戏,也可以是很多游戏串起来。原则上讲就是在不同系统中提高学习架构的智能。这个是比较有前途的方向,也是我希望最终能发布研究成果的方向之一。


Q:现在有不少做量化交易的团队称用了人工智能技术进行交易,不知道你是否了解AI在这方面的应用?

A:很多人说用人工智能,但是人工智能是个很广阔的领域,我很难判断他们是否实质上在使用近两三年的新成果。


Q: 你怎样思考公司的商业模式?

A:所谓“商业模式”的主要目的,就是作为企业,有钱进来。先融资,请工程师,做个系统,卖给别人。这些人获取了商品服务把钱给我。但如果我可以直接卖一些股权,把钱收回来,我可以节省这个流程。

你作为一个研发的机构,做了很好的项目,比如你解决了哥德巴赫猜想,其实你只需要卖一点点股权,就可以进来很多钱。不用再去走这个流程,卖东西再进来钱。这个对你的精力也是一种分散。

这件事情的价值是在最后,我们可以去建成一个好的、智能的基础设施的时候。价值是巨大的。你可以自动生成Google、Facebook的东西。如果20年能建成,你给它一个估值吧。Bill Gates曾经说谁要能突破Machine Learing,这个价值至少是10个Microsoft。你的精力应该放在增加实现这件事情的概率上,时间不应该去做商业上的应用,除非这个应用很好做。但没必要找个团队,去跟客户沟通。我并不是从原则上反对商业化,如果商业化能促进这件事发展,我们也会做。

(我第二次跟闫安聊天时,闫安告诉我:如果你现在问我同样的问题,我会回答公司不再考虑商业模式,而是以非营利的方式来运作,类似美国的 OpenAI )。


Q:你现在在寻找合伙人吗?

A:合伙人、员工、投资者,都可以找。还是要看大家的兴趣。

我没有特别花精力找投资者。投资者一进来就是给钱,拿股权。一年见不到几次。我不希望这样的交互。我希望持股的人跟我有很多的时间一起做事情。理想情况是找到一起做事情的合伙人。有时间学习又没财务压力的人,不太好找。退而求其次,就是一边发工资,一边融资。



多看一眼:

“囚”室里的北京梦

陆挺:见证黄金年代

能用加法赚钱,我绝不用乘法

“傻一点,轴一点”:基金经理诠释一万小时天才秘诀



交易门跟踪报道

点击时间查看

徐    宁

2015-07

2016-03


韩    超

2015-07

2015-12


查尔斯

2015-08

2016-04


张    展

2015-08

2017-02


更多跟踪报道,正在进行中……


*往期主角回顾:

徐宁 | 韩超 | 向勇 | 关工 | 宗旺 | 张展 | 比歌 | 查尔斯 | 墨有鱼 |曾盛敏 | 谢飞 | 麦克 | 夏淼 | 文波 | 杨朱 | 佩里 | 迪恩 | 陈达 | 柯安迪 | 魏嘉 | 王磊 | 克劳德 | 晚枫 | 杨春 | 婷姐 | 周密 | 曹晋波 | Alan | 刘夏 | YY | 韦哥 | Samuel | 李奥 | 汤隆 | 思凯 | 董可人 | 慧哥 | 索超 | 石枫 | 罗烜 | 邹志峰 | 陈旭飞 | 无谓君 | 萧雳 | 裘慧明 | MC | 李云 | 艾伦 | 李佐凡 | 峰哥 | 杜迁 | 王轩 | 蔡庆 | 王啸 | 小萨 | 童威 | 樊瑞 | Sky | 虎哥 | 薛永 | 胖虎 | 陆挺 | 许韬  | 巍子 | 土匀 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存